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Verfahren zur Herstellung oligomerer oder polymerer Funktionselemente aus Formenelementen, wobei die Funktionselemente 
erh&ltlich sind durch Verkntlpfung von mindestens zwei Formenelementen, von denen mindestens ein Formenelement selbst aus mindestens 
zwei Monomeren aufgebaut ist, die durch mindestens eine chemische Bindung verknupft sind, die der chemischen Bindung zwischen zwei 
Formenelementen entspricht. 


LEDIGUCH ZUR INFORMATION 


Codes zur Identifizierung von PCT-Vertragsstaatcn auf den Kopfbdgen der Schriften, die Internationale 
Anmeldungen gemass dem PCT veroffentlichen. 


AT 

Osterreich 

GA 

Gabon 

MR 

Mauretanien 

AU 

Austral icn 

GB 

Vereinigtes Konigreich 

MW 

Malawi 

BB 

Barbados 

GE 

G< org icn 

NE 

Niger 

BE 

Belgicn 

GN 

Guinea 

NL 

Niedcrlande 

BF 

Burkina Faso 

GR 

Griechenland 

NO 

Norwegen 

BG 

Bulgarien 

HU 

Ungam 

NZ 

Neuseeland 

BJ 

Benin 

IE 

Irland 

PL 

Polen 

BR 

Brasilicn 

IT 

Italien 

PT 

Portugal 

BV 

Belarus 

JP 

Japan 

RO 

Rum&nicn 

CA 

{Canada 

KE 

Kenya 

RU 

Russische Federation 

CF 

Zentrale Afrikanische Republik 

KG 

Kirgisistan 

SD 

Sudan 

CG 

Kongo 

KP 

Demokratische Volksrepublik Korea 

SE 

Schweden 

CH 

Schweiz 

KR 

Republik Korea 

SI 

Slowenien 

CI 

Cote dUvoire 

KZ 

Kasachstan 

SK 

Slowakei 

CM 

Kamcrun 

LI 

Liechtenstein 

SN 

Senegal 

CN 

China 

LK 

Sri Lanka 

TD 

Tschad 

cs 

Tschcchoslowake i 

LU 

Luxemburg 

TG 

Togo 

cz 

Tschechische Republik 

LV 

Lett I and 

TJ 

Tadschikistan 

DE 

Deutschland 

MC 

Monaco 

TT 

Trinidad und Tobago 

DK 

Dane mark 

MD 

Republik Moldau 

UA 

Ukraine 

ES 

Spanien 

MG 

Madagaskar 

US 

Vercinigte Staaten von Amcrika 

FI 

Finnland 

ML 

Mali 

uz 

Usbekistan 

FR 

Frankreich 

MN 

Mongolei 

VN 

Vietnam 


WO 95/17413 PCT/EP94/04240 


Verfahren zum evolutiven Design und Svnthese funktionaler 
Polymere auf der Basis von Formenelementen und Formencodes 

Gegenstand der vorliegenden Erf indung ist ein Verfahren gemafi 
Anspruch 1 . 

Die rasante Entwicklung der letzten Jahre im Bereich der Bio- 
wissenschaf ten hat nicht nur die Grundlagenf orschung, sondern 
gerade auch die angewandte Forschung in diesem Feld stimu- 
liert. Proteine spielen hier aufgrund ihres breiten Wirkungs- 
spektrums eine herausragende Rolle. Ein ganzer Zweig der 
modernen Biotechnologie beschaftigt sich heute mit dem sog. 
"Protein Engineering", d.h. der Herstellung von Designer- 
Proteinen, die entweder auf der Grundlage bekannter Proteine 
durch graduelles Abandern oder durch vollstandige Neusynthese 
entwickelt werden. Man unterscheidet hier vor allem zwei 
Ansatze, das rationale und das irrationale Design. 

Rationales Design ist darauf aus, eine Aminosauresequenz zu 
produzieren, die sich in eine gewiinschte Struktur faltet, 
und zusatzlich die erhoffte Funktion aufweist, Damit hangt 
diese Strategie ganz of f ensichtlich von einem tiefen Ver- 
standnis des "Protein folding" ab . Fortschritte in den 
letzten Jahren betrafen u.a. das rationale Design einfacher 
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Struktur-Domanen. Das Design groSerer Proteine mit komplexen 
oder gar beispiellos neuen Eigenschaf ten liegt jedoch immer 
noch aufierhalb der Moglichkeiten dieses Ansatzes. Dem- 
gegenuber setzt irrationales Design keine Informationen liber 
die Proteins truktur, Proteinf altung etc* voraus . Einzig die 
Kenntnis der gewunschten Eigenschaf t und eine Moglichkeit, 
Molekiilpopulationen gemessen an dieser Eigenschaft zu be- 
werten, sind hier Voraussetzung . Ausgehend von einer "com- 
binatorial library" aus Peptiden oder Proteinen werden 
Molekule mit der gewiinschten Eigenschaft selektiert und erst 
im Nachhinein analysiert. Hier wird also der Mechanismus, 
nachdem ein Molekul die gestellte Aufgabe meistert, nicht 
im voraus determiniert . 

Obwohl dieser Ansatz in sehr eleganter Weise gerade auch in 
jvingster Zeit Peptide mit einfachen und 2. T. neuen Eigen- 
schaf ten hervorgebracht hat, stellt sich auch hier das 
Problem, wie man zu groSeren Proteinen mit komplexeren 
Funktionen kommen kann. Schon eine vollstandige Bank eines 
20mers liefert mit 20 20 = 10 2€ verschiedenen Sequenzen eine 
astronomisch hohe Zahl zu untersuchender Molekule. Soli die 
Peptidsequenz auch noch durch eine Nucleinsaure codiert 
werden, stellt sich das Problem in noch gravierender Weise. 
Da der genet ische Code degeneriert ist, d.h. eine Aminosaure 
u.U. durch mehrere verschiedene Codons represent iert wird, 
ergibt sich hier eine Zahl von mindestens 4 €0 = 10 3S Mole- 
kulen, die synthetisiert werden. Normalerweise wird an der 
dritten Codonposition nur G oder C zugelassen, um Stopcodons 
weitgehend zu vermeiden. Die verbleibende Zahl von IO 30 
Molekulen ubersteigt noch immer die Standardausbeute einer 
kommerziellen DNA-Synthese um 12 GroSenordnungen . Eine 
weitere Reduktion der pro Position zugelassenen Codons wurde 
von Youvan vorgeschlagen . Ob diese Methode den meEbaren Se- 
quenzraum nicht in unzulanglicher Weise einschrankt, gerade 
bei der Suche nach neuen Funktionen, bleibt abzuwarten. 
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Zum Aufbau funktionaler Strukturen arbeitet die Natur mit 
modularen Systemen. Bekannt sind die Nucleotidbausteine , die 
Aminosaure-Bausteine (als Nucleotidtripletts kodiert) und 
Exon-Domanen (aus Aminosaurebausteinen aufgebaut) . Die evo- 
lutive Optimierung funktionaler Biopolymere entsprechend der 
Patentanmeldung WO 92/18645 geht von der Vorstellung aus, 
durch kontinuierliche Verbesserung bestehender Basiseigen- 
schaften, z. B. eines Enzyms, bei der kont inuierlichen 
Anpassung an erwunschte Reaktionsbedingungen wie Ionenstarke 
Temperatur, pH-Wert eine optimale Struktur zu finden. Sind 
vorteilhafte oder mindestens neutrale Mutationen moglich, 
so sind durch mehrmalige Wiederholungen von Selektion und 
Mutation auch entfernte Bereiche des Sequenzraumes zugang- 
lich, die durch die Ausgangspopulation nicht abgedeckt waren. 
Von der ursprunglichen, bereits f unktionsf ahigen Struktur 
entfernt man sich jedoch bei diesem Vorgehen in keinem 
Schritt. Optimiert wird eine Eigenschaft des Aus- 
gangsmolek&ls , die bereits - wenn auch in bescheidenem Mafie 
- im ursprunglichen Molekul inharent ist. Der "Pfad", den 
eine solche Evolution durch den Sequenzraum nimmt, ist 
bestimmt durch die zuganglichen, in Richtung der Optima 
fuhrenden Grate in der unterliegenden Wertelandschaf t . Wie 
bei alien Methoden f die den Sequenzraum nicht vollstandig 
erschliefien, besteht bei diesem Vorgehen die nur schwer 
einzuschatzende Gefahr, in einem lokalen Optimum stecken- 
zubleiben. Fur die Praxis bedeutet dies, da£ bestimmte 
Regionen des Sequenzraumes einschlieSlich der dort bef ind- 
lichen Optima, durch breite und tiefe "Taler" abgetrennt 
sind. Bei der begrenzten PopulationsgroSe von Molekulspezies 
in Experimenten (P 43 22 147, WO 92/18645) ist aber die Wahr- 
scheinlichkeit zu niedrig, entfernte Vielf ehlermutanten zu 
erzeugen, die sich jenseits dieser Schranke befinden und den 
Weg zu diesen neuen Optima anzeigen. 

Die Natur hat eine Anzahl von Mechanismen entwickelt, mit 
dieser Problematik umzugehen: lange Entwicklungszeitraume , 
Rekombinationsverf ahren (horizontaler Gentransfer, Crossing- 
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over, Genkonversion, Exon-Rekombination (exon-shuf fling) , 
Virusshuttles, mobile Elemente (Transposons) , Untereinheiten- 
Struktur von komplexen Proteinen) ) sowie Multigenf amilien 
mit Pseudogenen . 

Mit der Anzahl der parallel gefuhrten Mutantenbildung und 
Selektion lafit sich die Chance auf Erzeugung einer ge- 
wunschten Vielf ehlermutante erhohen; durch Rekombination 
lassen sich mutierte Gensegmente effizient mischen. 
Funktionslose. Pseudogene als Mitglieder einer funktions- 
fahigen Multigenf amilie lassen sich als Vielf ehlermutanten 
auch liber langere Entwicklungszeitraume ohne Gegenselektion 
in ihrer Existenz erhalten, urn eventuell bei Ruckerhaltung 
einer Funktion wieder positiv selektierbar zu werden , 

Die Ubertragung dieser Mechanismen auf eine effiziente in 
vitro Optimierung ist of f ensichtlich nicht ohne weiteres 
moglich. Die Schwierigkeiten mussen jedoch in jedem Falle 
fur solche Auf gabenstellungen gelost werden, bei denen eine 
kontinuierliche Optimierung nicht erwartet werden kann. Dies 
trifft insbesondere fur solche Anpas sungspro z e s s e zu, bei 
denen eine Funktion vollstandig neu etabliert werden muS. 

Das der Erfindung zugrundeliegende technische Problem be- 
trif ft die Bereitstellung eines Verfahrens zur Herstellung 
oligomerer oder polymerer Funktionselemente wie Biopolymere 
mit funktionalen Eigenschaf ten, beispielsweise Enzymen, 
Ribozymen, Wirkstoffen, etc. Dabei soli unter Ausnutzung 
evolutiver Strategien ein den herkdmmlichen Screening-Ver- 
fahren iiberlegenes Verfahren bereitgestellt werden. 

Gelost wird dieses Problem durch ein Verfahren mit den 
Merkmalen des Anspruchs 1. Die sich daran anschliefienden 
Unteranspruche betreffen bevorzugte Ausf iihrungsf ormen des 
erf indungsgemafien Verfahrens. 
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Erf indungsgemaS werden zur Herstellung oligomerer oder 
polymerer Funktionselemente aus Formenelementen zunachst 
Formenelemente durch chemische oder enzymatische Verkniipfung 
von mindestens zwei Monomeren aufgebaut und die so erhalt- 
lichen Formenelemente dann zu Funkt ionselementen verknupft. 
Dabei entspricht die Natur der chemischen Bindung zwischen 
den Monomeren derjenigen zwischen den jeweiligen Formen- 
elementen. Die so erhaltlichen Funktionselemente konnen dann 
auf die bestimmten potent iellen Funktionen getestet werden. 
Die Vorteile der erf indungsgemaSen Vorgehensweise werden 
durch die nachfolgende Beschreibung weiter verdeutlicht . 

Bevorzugt wird die Verknupfung der Formenelemente unter 
Einsatz einer festen Phase als Reaktionstrager durchgef uhrt . 
Die Verkniipfung der Formenelemente kann chemisch und/oder 
enzymatisch erfolgen. Die Verkniipfung der Formenelemente zu 
den Funkt ionselementen kann entweder planmaSig durch gezielte 
Zugabe der einzelnen Formenelemente und nachf olgender Ver- 
kniipfung oder auch statistisch durch zufallig gesteuerte 
Zugabe der Funktionselemente und deren Verknupfung erfolgen. 
Es ist dabei moglich, die Verkniipfung schrittweise aufbauend 
stereospezif isch und/oder gerichtet durchzuf uhren * 

Als Formenelemente kommen vorzugsweise Nucleinsauren, doppel- 
strangige oder einzelstrangige DNA und/oder RNA und/oder 
modifizierte Nucleinsauren in Frage. Als Formenelemente 
kommen auch Peptide und/oder Polypeptide und/oder sonstige 
kopplungsf ahige chemische Oligomer-Formenelemente in Frage. 
Dazu konnen auch Oligo- oder Polysaccharide gehoren. 

In einer bevorzugten Ausf iihrungsf orm des erf indungsgemaSen 
Verfahrens werden die Formenelemente als bereits syntheti- 
sierte Oligomerbausteine eingesetzt oder im Reaktionsgef afi 
quasi in situ hergestellt. 


Es ist vorteilhaft, die Reaktion der Formenelemente in 
parallel gefuhrten Mikroreaktionsansatzen (wie in P 43 22 
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147.5 vorgeschlagen) durchzuf uhren, bei denen die Formen- 
elemente in vorbest immter Reihenfolge verknupf t werden . 
Insbesondere werden nach erfolgter Synthese die Reaktions- 
produkte wie Funktionselemente oder Vorstufen davon an der 
festen Phase gebunden bleiben und nach Abtrennung der 
Reaktionspartner weiter verarbeitet oder von der Festphase 
entkoppelt. Es ist jedoch ebenfalls moglich, die Reaktion 
in geeigneten, dem Fachmann bekannten Reaktionsbedingungen 
in Losung durchzuf uhren oder die f estphasengekoppel te oder 
in homogener Losung durchgef uhrte Reaktion miteinander zu 
kombinieren. 


Durch Einsatz der Fluoreszenzkorrelationsspektroskopie (FCS) 
(PCT/EP 93/01291) wird es ermoglicht, die Funktionsweise der 
Funktionselemente im gleichen Volumenelement direkt zu 
bewerten, in dem auch die Synthese ablauf t . Dies bedeutet 
eine sehr direkte Moglichkeit, das Ergebnis einer aufbauenden 
Funkt i ons e 1 ement syn t he s e zu kontrollieren . 

Vorzugsweise wird pro Reaktionsschritt , bei der schrittweisen 
Verknupf ung der Formenelement , jeweils ein Formenelement als 
Reaktionspartner an fester Phase gekoppelt . Es k6nnen auch 
Mischungen von Formenelementen eingesetzt werden und/oder 
im Reaktionsgef a£ direkt generiert werden. Werden als Formen- 
elernente Nucleinsauren verwendet , so ist es vorteilhaft, 
wenigstens einen Reaktionspartner mit einer Schnit tstelle 
eines Restriktionsenzym zu versehen oder ein Nucleinsaure- 
formenelement zu verwenden, welches frei von Start- und/oder 
Stopcodons ist. Vorzugsweise sind die Reaktionsschnittstellen 
solche, die von Restriktionsenzymen der Klasse IIS erkannt 
werden konnen. Die Einfuhrung von Restriktionsschnittstellen 
dieser Enzymklasse ist vorteilhaft, da beliebige Sequenzen 
gerichtet verknupf t werden konnen, ohne dafi die Wahl des 
Reaktionsenzyms die Sequenzerf ordernisse des Endproduktes 
beeinf lu£t . 
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Sind in den zu verknupf enden Formenelemente einzelstrangige 
Uberhange eingefuhrt, so konnen daruber beliebige Sequenzen 
gerichtet verknupf t werden, ohne dafi dabei irgendwelche 
Anforderungen an die Sequenz des gewunschten Endproduktes 
gestellt werden mussen. Dieses Erfordernis kann auch durch 
selektive und reversible chemische und/oder enzymat ische 
Modif kation der 3'- und/oder 5' -Enden der Nucleinsauren, zum 
Beispiel durch Phosphorylierung anstelle und in Kombination 
mit der Einfuhrung der einzelstrangigen Uberhange erzielt 
werden. ' 

Als Beispiel fur eine reversible chemische Modif ikation ist 
das Ankoppeln einer Trityl-Schutzgruppe, die durch Behandlung 
mit Essigsaure abspaltbar ist, zu nennen. Die Einfuhrung 
der Tritylgruppe am 3'- oder 5'-Ende des Nucleotids fiihrt 
zur Blockade der Ligation der Formen- und/oder Funktionscodes 
bzw. -elemente. 

Durch Behandlung eines Oligo- oder Polynucleotids mit 
Nuclease kann ein 3'- oder 5'-Ende modif iziert werden, zum 
Beispiel wird durch Behandlung mit Exonuclease III das 3'- 
Ende durch Abdauung modif iziert. Wenn in das entsprechende 
Oligo- oder Polynucleotid (z. B. DNA) Nucleotidtriphosphate 
eingebaut werden, so stoppt die Exonuclease am ersten Thio- 
Nucleotid die Abdauung. Damit ergibt sich eine regulierbare 
Modif izierung des Endes des Oligo- oder Polynucleotids. 

Das erf indungsgemafie Verfahren erlaubt den Einsatz von 
Formenelementen, die nach rontgen-kristallographisch analy- 
sierten naturlichen Funktionsdomanen von Proteinen und 
Polypeptiden bekannt sind. Es konnen so bereits bekannte 
Bausteine bzw. Module von in der Natur bereits vorkommenden 
Funktionselementen benutzt werden. 

Die zu verwendenden Formenelemente konnen auch aus 
Selektionsexperimenten gewonnen werden. 


PCT/EP94/04240 


WO 95/17413 PCT7EP94/04240 

- 8 - 


Insbesondere vorteilhaf t ist die Verwendung von Formenelemen- 
ten in einer Lange von 1 bis 60 Aminosauren oder Nucleotide 
sequenzen entsprechender Kodierungslange . Die Formenelemente 
konnen auch an bestimmten Positionen degeneriert sein 
und/oder Deletionen oder Insertionen tragen, insbesondere 
bei Verwendung von Nucleotiden als Formenelemente. 

Es wird auch die Verwendung des erf indungsgemafien Verfahrens 
wie oben beschrieben zur Synthese parallel aufgebauter 
Formen-Bibliotheken funktionaler Oligomere oder Polymere 
beansprucht . 

Die urspriingliche Aufgabe von "combinatorial libraries" ist 
eher das Angebot einer Funktionen-Vielf alt als einer Sequenz- 
vielfalt. Es ist heute eine Tatsache, da£ die drei- 
dimensionale Struktur von Proteinen relativ stabil gegen 
Substitutionen einzelner Aminosauren ist, Durch die gro£e 
Zahl aufgeklarter Proteinstrukturen gewann man die Er- 
kenntnis, daS Proteine zwar keine oder nur sehr geringe 
Sequenzhomologie aufweisen konnen, aber trotzdem die gleiche 
oder sehr ahnliche 3D-Struktur einnehmen konnen. Dies beruht 
moglicherweise darauf, dafi nur eine begrenzte Anzahl mog- 
licher Faltungsweisen von Aminosaureketten unter biologischen 
Bedingungen stabil ist . Strukturelle Verwandtschaf t spiegelt 
aber auch die Evolution rezenter Proteine aus einer relativ 
begrenzten Zahl von Ur-Strukturen, -Modulen heraus wieder. 
Diese Module konnen als kleine, funktionelle Domanen oder 
kompakte Struktureinheiten verstanden werden und konnen auch 
in heutigen Genen leicht aufgespurt werden. In der Hypothese 
des "Exon-shuf fling" wird vermutet, daS die Evolution zu 
komplexeren Proteinen gerade durch die Kombination von Exons, 
also Modulen im oben beschriebenen Sinn enorra beschleunigt 
wurde , Wenn man annimmt , daS die Zahl der Exons , die die 
Konstruktion aller heute bekannten Proteine erlauben wurde, 
zwischen 1000 und 7000 zu suchen ist, eroffnet eine hier- 
archische Strategie des 11 Protein Design" mit Bausteinen 
zunehmender Komplexitat die Moglichkeit der viel schnelleren 
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Durchmessung eines "shape space" mit zugehorigerer "fitness 
landscape" als es die Suche in einer traditionellen 
"combinatorial library" gestatten wiirde . Ein Protein aus 
150 Aminosauren (die GroSe einer klassischen Nucleotid- 
bindungsstelle, der sog. "Rossman fold") mii&te nach herkomm- 
lichem Verfahren aus einer Bibliothek von 20 150 = 10 19S ver- 
schiedenen Aminosauresequenzen selektiert werden . Kombi- 
nationen von 1000 verschiedenen Modulen der Lange 3 0 Amino- 
sauren ergeben hingegen nur eine Komplexitat von 1000 5 = 10 15 
Molekulen. 

Das erf indungsgemaSe Verfahren ist ein hierarchisches Ver- 
fahren zum Design von Proteinen, Nucleinsauren deren 
Derivaten oder chemischer Oligo- oder Polymere mit bestimmten 
gewunschten Eigenschaf ten, ausgehend von Modul-Bibliotheken, 
im folgenden als Formenelemente bezeichnet. Erf indungsgemaS 
konnen die Formenelemente auch Gensegmente sein, die fur 
Formenelemente kodieren. Die als Module fungierenden Formen- 
elemente sollen zufallig kombinierbar sein. Kleinere Proteine 
oder Untereinheiten fur grofiere Proteine mit bestimmten 
Eigenschaf ten werden in einem anschlie&enden Selektions- 
schritt aus dem Pool von Modulkombinationen herausgesondert 
und konnen ihrerseits wieder als Bausteine in einer Unterein- 
heits-Bibliothek dienen, u.s.w. 

Auf jeder Konstruktionsstuf e kann durch fehlerhafte Kopierung 
einzelner Bausteine zusatzlich ein "Rauschen" auf Aminosaure- 
sequenzebene eingefiihrt werden. Dies ermoglicht die Modu- 
lierung der dreidimensionalen Anordnung chemischer Gruppen 
und somit eine weitere funktionelle Optimierung selektierter 
Molekule. Die vorgeschlagene Strategie erfordert eine neue 
Art von "Artificial Gene Assembly" . 

Bisher werden vor allem zwei Methoden angewandt, denen 
gemeinsam ist, daS die DNA in einer bestimmten Orientierung 
ligiert wird, urn damit auch die Abfolge der Aminosauren 
festzulegen* Die wohl alteste Methode - von Khorana und 
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seinen Mitarbeitern entwickelt - arbeitet mit uberlappend 
komplementaren einzelstrangigen DNA Molekulen, die vor.der 
Ligation miteinander hybridisiert werden. Die zweite Methode 
nutzt Schni ttstellen von Restrikt ionsenzymen im zu 
konstruierenden Gen, urn an diesen Stellen das Gen in Blocke 
zu unterteilen, die dann in mehreren auf einanderf olgenden 
Schritten zusammengesetzt werden. Durch beide Methoden wird 
die Sequenz an den Ubergangen der verwendeten Oligo-DNAs bzw. 
Blocke methodisch bedingt festgelegt. Dies aber entspricht 
gerade nicht der Anforderung nach beliebiger Austauschbarkeit 
der einzelnen Module schon in der Konstruktionsphase des 
Gens. Bestandteil der vorliegenden Erfindung ist also not- 
wendigerweise auch eine neue Art des "Artificial Gene 
Assembly" . Erf indungsgemaS wird in allgemeiner Form wie f olgt 
verf ahren : 

Das Verfahren des "Artificial Gene Assembly" arbeitet 
analog des in der WO 92/18645 beschriebenen Verfahrens; 

das Verfahren erschlieSt nicht den Umgang mit der 
Varianz im Sequenzraum sondern mit der Varianz im 
sogenannten Fortnenraum . Der Formenraum, gebildet aus 
Basiselementen def inierter stabiler Formenelemente , 
reduziert die Komplexitat der Varianten der Bauelemente 
des Sequenzraumes; 

das Verfahren erschlie&t den Funktionsraum uber eine 
Variation von Bausteinen des Formenraumes ; 

als Bausteine werden Bausteine des Form-Codes (siehe 
unten) eingesetzt; 

fur die Auswahl der Bausteine werden bestimmte Aus- 
wahlkriterien zur Vorselektion eingesetzt, die 
theoretischen Annahmen entsprechen oder naturlichen 
Formen- Analoga entsprechen . 
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Als Module zur parallel gefuhrten Variation (Mutation) und 
Selektion stehen bislang nur die Nucleotide oder Aminosauren 
als synthetisch oder enzymatisch handhabbare Bausteine eines 
Polymers fur gerichtete Kopplungsprozesse zur Verfugung. 
Der direkte Zugang zu einer funktionalen Oberf lachenstruktur 
eines Polymers scheitert wie oben angefuhrt in vielen Fallen 
am Problem der groSen Zahlen der Varianten des Sequenzraumes . 

Gegenstand dieses evolutiven Anpassungsprozesses ist der 
Einsatz modularer Bausteine, dem Formencode, bestehend aus 
den Formenelementen . Der Formencode umfafit Formenelemente , 
aufgebaut aus Elemencen des Sequenzraumes. Der Formencode, 
wie er beispielsweise aus naturlichen Polymeren wie 
Proteinen, Polypeptiden oder funktionalen Nucleinsauren 
abgeleitet werden kann, kodiert unter f estgesetzten auEeren 
Bedingungen stabile Formenelemente ( Sekundar s t ruktur en , 
eventuell Tertiarstrukturelemente enthaltend) . Dabei ist 
bemerkenswert, da£ sehr unterschiedliche Sequenzen (Primar- 
strukturen) fur sehr ahnliche Formenelemente kodieren konnen, 
Mit anderen Worten, im Formenraum sehr eng benachbarte 
Elemente konnen im Sequenzraum sehr weit voneinander entfernt 
liegen (groSe Hamming Distanz) . Das gleiche gilt fur den 
umgekehrten Fall. Im erf indungsgemafien Sinne eirklart eben 
diese Eigenschaft, daS bereits der Austausch formenmafiig 
gleicher Sequenzen im Sequenzraum einen grofien Schritt im 
Sinne einer Vielf ehlermutante bedeuten kann* Mit Hilfe der 
erf indungsgemafien angesprochenen Syntheseverf ahren ist diese 
Anforderung technisch umsetzbar. Die Erstellung der ent- 
sprechenden Verteilungen gelingt durch programmierte 
Synthese. Sie ist nicht, wie in WO 92/18645 beschrieben, 
durch fehlerhafte Replikation im Sinne f ehlerbehaf teter 
PCR-Verf ahren zu erreichen. 

Bei der linearen Kombination von Formencodes konnen hetereo- 
loge wie auch zumindest teilweise homologe Formencodes 
verwendet werden, die genotypisch durch einen Formencode 
naturlichen oder kunstlichen Ursprungs definiert werden. 
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Unter natiirlichem Ursprung wird erf indungsgemafi verstanden, 
dafi auf schon vorhandene genetische Informationen zuruckge- 
griffen wird, wie sie beispielsweise im Genom von Organismen 
niedergelegt ist . Unter Formcodes kunstlichen Ursprungs wird 
auf Nucleinsaureebene erf indungsgemafi insbesondere ver~ 
standen, da& Sequenzen durch Algorithmen mittels Datenver- 
arbeitungsanlagen generiert werden konnen, urn anschliefiend 
nach diesen Anweisungen chemisch synthet isiert zu werden. 
Schliefilich ist auch eine Herstellung durch de novo-Synthese 
moglich, indem Polymerasen mit den dazugehorigen Substraten 
wie Nucleotiden umgesetzt werden, Dabei kann die Polymerase - 
reaktion matrizenabhangig oder -unabhangig durchgefiihrt 
werden. 

Die Formenelemente und Funktionselemente, wie sie gemafi der 
Erf indung insbesondere verstanden werden, sind beispielsweise 
in Proteinen oder Peptiden als Phanotypen auf f afibar . Die 
entsprechenden Genotypen, beispielsweise auf Nucleinsaure- 
ebene, sind dazu die entsprechenden Formen- und Funktions- 
codes. Bleibt man zum Beispiel auf der Nucleinsaureebene so 
wird der "Phanotyp" mit Funktionselementen und/oder Formen- 
elementen, zum Beispiel durch ein Ribozym verkorperfc, welches 
genotypisch in einer Nucleinsauresequenz als Formencode 
und/oder Funktionscode entsprechend reflektiert wird. Dies 
bedeutet, daS erf indungsgemafi die Begriffe Funktions-/Formen- 
element (Phanotyp) stets quasi als komplementar mit dem 
Begriff Funktions- /Formencode (Genotyp) verstanden werden. 

Die Formenelemente und/oder Funktionselemente bzw. Formen- 
codes und/oder Funktionscodes konnen, sofern sie Nuclein- 
sauren sind, durch verschiedene Verfahren gewonnen werden, 
wie dies weiter oben angegebenen ist, namlich durch Ruckgriff 
auf schon bekannte Nucleinsauresequenzen, durch Generierung 
kunstlicher Sequenzen in Datenverarbeitungsanlagen oder durch 
de novo - Synt he s e . 
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Die Figur 8 erlautert die Begriff Sequenzraum, Formenraum 
und Funktionsraum. Analog der betrachteten Beziehung von 
Formenraum und Sequenzraum gilt fur die Beziehung von Formen- 
raum und Funktionsraum, daS eng benachbarte, homologe Ele- 
ment e im Formenraum im Funktionsraum weit voneinander ent- 
fernt sein konnen . Wie in Figur 8 schematisch angedeutet, 
ist fur die Funktion eines Polymers die Geometrie und die 
physicochemische Topologie und Dynamik der Molekiiloberf lache 
mafigebend, die mit einem zweiten Molekul in Wechselwirkung 
tritt . Die darunterliegende Struktur, definiert aus dem 
Formencode, konnte sehr unterschiedlicher chemischer Natur 
sein. Ahnliche Funktionen im Funk tionenra urn erklaren sich 
durch ahnliche Grenzf lachen-Topologien * 

Gerade im Hinblick auf die in Experimenten realisierbaren 
relativ kleinen Molekulpopulationen, ist es von ent- 
scheidender Bedeutung, dafi die erzeugte Variation im Formen- 
raum in viel ef f izienterer Weise als etwa die Variation im 
Sequenzraum die mogliche Funktionenvielf alt im Funktionsraum 
reprasentiert • 

Die f olgenden Figurenbeschreibungen erlautern an Beispielen 
schematisch die Erfindung naher , 

Die Figur 1 betrifft zwei einzelstrangige DNA bzw. RNA- 
Molekule, die chemisch oder enzymatisch (z.B. T4 RNfA Ligase) 
ligiert werden, wobei eines der Molekule liber einen spalt- 
baren Linker (z,B. Biot in-Streptavidin) an fester Phase 
immobilisiert ist, wahrend das andere Molekul frei in Losung 
vorliegt . 

Es stehen dazu heute eine ganze Reihe von Festphasen- 
materialien (z.B. magnet ische, oberf lachenaktivierte Kunst- 
stoffkugeln) zur Verfugung. Dieses Verfahren gestattet den 
schrittweisen Aufbau von groEeren DNAs bzw. RNAs . Nach jedem 
Ligationsschritt werden nicht umgesetzte RNAs weggewaschen 
und die an fester Phase befindlichen Ligationsprodukte in 
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den nachsten Ligationsansatz transf eriert , Vorteilhaf terweise 
ist die Handhabung, insbesondere die Reinigung der jeweiligen 
Ligationsprodukte sehr einfach. 

Nach AbschluiS der letzten Ligation wird das Produkt direkt 
als Eff ektormolekul eingesetzt oder in einer (in vitro) 
Translationsreaktion zunachst in die entsprechende Protein- 
struktur ubersetzt, welche dann als Eff ektormolekul f ungiert . 

Die Figur 2 betrif f t zwei vollstandig doppelstrangige DNA- 
Molekule, die chemisch Oder enzymatisch <z«B. T4 DNA Ligase) 
"blunt end 1 ' ligiert verden, wobei eines uber einen spaltbaren 
Linker an fester Phase immobilisiert ist, wahrend das andere 
frei in Losung vorliegt. Auf diese Weise kormen schrittweise 
grofiere doppelstrangige DNA Molekiile aufgebaut werden. Die 
gerichtete Ligation wird durch unterschiedliche Phosphory- 
lierung der Reaktionspartner erreicht. Modul A und das letzte 
Modul sind so entworfen, da£ sie jeweils eine Schnittstelle 
fur ein Restriktionsenzym enthalten. Dies ermoglicht erstens 
die Abspaltung des Produktes von der festen Phase und zweit- 
ens die anschlieEende, gerichtete Klonierung der DNA (siehe 
auch Figur 5) . 

Zu Figur 3 : DNA-Molekule konnen gemaS Figur 2 ebenfalls 
ligiert werden, wenn das in Losung befindliche Molekul an 
einer Seite ein einzelstrangiges Ende besitzt, d.h. *nicht 
vollstandig doppelstrangig vorliegt. Dieses Ende stent auf 
diese Weise nicht fur die Doppelstrang-spezif ische Ligation, 
z.B. mit T4 DNA Ligase zur Verfugung. In Kombination mit den 
schon erwahnten Phosphorylierungsstrategien (Figur 2, insbe- 
sondere Variante 1) ergibt sich die Moglichkeit, die Ligation 
ohne unerwunschte Nebenprodukte durchzuf uhren. Das in Losung 
befindliche DNA-Molekul kann so entworfen sein, daS es vor 
seinem einzelstrangigen Ende noch die Schnittstelle eines 
Restriktionsenzyms vorzugsweise die eines Class IIS Enzyms 
(z.B. Alwl) mit Erkennungsstelle in dem abzuschneidenden, 
teilweise einzelstrangigen DNA-Stuck) besitzt. Nach der 
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Ligation kann das Ligationsprodukt an fester Phase mit dem 


entsteht wieder ein vollstandig doppelstrangiges DNA-Molekul 
an fester Phase. Alternativ kann das einzelstrangige Ende 
mit einer Polymerase zum Doppelstrang aufgefullt oder mit 
einer Exonuclease abverdaut werden . 

Zu Figur 4 : Restrikt ionsschnitt stellen konnen (uberlappend) 
auch entstehen, indem zwei doppelstrangige DNA-Molekule 
miteinander ligiert werden. 

Zu Figur 5: Vollstandig oder teilweise doppelstrangige 
DNA-Mblekiile konnen gemaS Figuren 1-4 ligiert werden, auch 
wenn Mischungen von Molekulen (z. B. B, C, D) verwendet 
werden. Auf diese Weise entstehen Mischungen von immobi- 
lisierten Molekulen, die jeweils verschiedenen Kombinationen 
der eingesetzten Bausteine entsprechen. Am Ende des letzten 
Ligationsschrittes kann die Gesamt-DNA oder ein Teil davon 
mit Hilfe von Restrikt ionsenzymen, die innerhalb des Kon- 
struktes schneiden, von der festen Phase abgespalten und ggf . 
in ein Phagen- oder Bakteriendisplay- System kloniert werden. 
die DNA kann aber auch in einem kombinierten in vitro Trans - 
kriptions- und Translationssystem exprimiert werden. 

Zu Figur 6: Ausgehend von Modul-Bibliotheken konnen Peptide, 
Proteindomanen und kleine Proteine durch zufallige Kom- 
bination von einzelnen Modulen erzeugt werden. Entsprechend 
einem hierarchischen Verfahren zum Proteindesign konnen in 
einer weiteren Stufe dann auch Proteindomanen als Bausteine 
kombiniert werden. Auf jeder Komplexitatsstuf e konnen 
Mutationen eingefiigt werden, die - ohne die globale Struktur 
zu verandern - eine Feinabstimmung der dreidimensionalen An- 
ordnung chemischer Gruppen erlauben. 


Restrikt ionsenzym geschnitten werden . 


Auf diese Weise 


Figur 7 erlautert schematisch, da6 verschiedene Proteine 
trotz unterschiedlicher , katalytisch aktiver Aminos&uren im 
aktiven Zentrum in Bezug auf das Substrat homologe Funktionen 
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besitzen (Chymotrypsin/Trypsin) oder trotz ahnlicher raum- 
licher Anordnung der Aminosauren im aktiven Zentrum ganzlich 
unterschiedliche Reaktionen katalysieren (Trypsin/Elastase) 
konnen . 

Figur 8 erlautert den Zusammenhang der Begriffe Sequenzraum- 
Formenraum- Funkt ionsraum . 

Fig. 9-11 

Oligomere oder Polymere werden durch matrizenabhangige, 
enzymatische oder chemische Synthese durch Verlangerung von 
stochastischen (randoirlsierten) oder ausgevahlten (kon- 
struierten) Primer-Molekulen hergestellt. Die Primer konnen 
komplementar zu 1.) diskreten Sequenzen ausschlie£lich am 
Ende des ursprunglichen Matrizen-Molek&ls (Figur 9/10) 
diskreten Sequenzen uberall im urspriinglichen Matrizen- 
Molekul sein (Figur 10/11) aus einer Mischung von Zufalls- 
sequenzen bestehen, die die Synthese je nach (teilweiser) 
Komplementaritat zufallig an vielen Stellen beginnen lassen 
(Fig. 10) . 

Entweder die Primer oder, wie in der Figur gezeigt, auch die 
Matrizen-DNA konnen zur Vereinf achung spaterer Auf reinigungs- 
prozeduren biotinyliert sein. Dies vairde insbesondere bei 
der Strangtrennung (z. B. an Streptavidin-Dynabeads) zur 
Aufreinigung der verlangerten Primer gunstig sein. 


Statt normaler dNTPs (Desoxy-Nucleosidtriphosphate) werden 
insbesondere thio-NTPs eingesetzt . Kettenabbruchmolekiile 
konnen dann zum Beispiel normale ddNTPs (Didesoxy-Nucleosid- 
triphosphate) sein. Es ist bekannt, daS Phosphodiester- 
bindungen leicht durch Exonuclease III in 50 mM Tris/HCl, 
5 mM MgCl 2 , bei pH 10,0 spezifisch in Minuten gespalten 
werden konnen. Thiophosphat -Bindungen werden dagegen nicht 
gespalten (Labeit et al . , DNA 5:173, 1986) . Auf diese Weise 
kann man nach Inaktivierung der Polymerase die Enden der 


Fig. 12 
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entstandenen Polymere durch enzymatisches Entfernen der 
ddNTPs "entschiitzen" . 


Die entstandenen und entschutzten Polymere konnen entweder 
thermisch Oder chemisch, z. B. mit NaOH, getrennt werden, 
wobei sich die Biotin-gekoppelten Moiekule z. B. an 
Streptavidin-Dynabeads abtrennen lassen. Nach Einstellen 
physiologischer Bedingungen hybridisieren die entschutzten 
Polymere zu teilweise uberlappenden Duplices . 


PCR ohne Primer fiihrt zur eigentlichen (Re- ) Kombination der 
Polymere und zur weiteren Verlangerung derselben. Nachdem 
die teilweise uberlappenden Duplices vervollstandigt wurden, 
findet eine weitere PCR mit (endstandigen) Primern staat, 
die wieder Produkte der ursprunglichen Lange erzeugt . 
Darunter befinden sich auch solche Sequenzen, in denen 
mehrere Marker vereinigt, neu kombiniert sind. 

Der Sequenzraum ist durch die linearen Nachbarschaf ts- 
beziehungen der Polymer-Bauelemente einer Polymers truktur 
definiert. Homologien beschreiben Ahnlichkeiten (in %) in 
der Abfolge der Bauelemente einer chemischen Stoffklasse. 
Je hoher der Verwandtschaf tsgrad zweier Sequenzen desto 
geringer der Abstand im Sequenzraum. 

a) ... AAT AATGCG C AAT ATTAGG C CT . . . 

b) . AATAAAAAGCAATATTAAGCCT . . . 

c) . . . TTAGCTAGCGATGCGCGCCGGG . . . 

Zum Beispiel weisen die Sequenzen a) und b) eine erhebliche 
Homologie auf , wahrend Sequenz c) keinerlei Ahnlichkeiten 
mit a) und b) zeigt. 


Fig. 13 


Fig. 14 


Der Formenraum ist definiert durch die " raumlichen" Nach- 
bar ^haf tsbeziehungen der durch ihn reprasentierten Polymere. 
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Der Abstand zweier Sequenzen ist durch den Verwandtschafts- 
grad ihrer Strukturen bestimmt* Homologie bedeutet hier 
Ahnlichkeit der Gesamtstrukturen von Polymeren, die wiederum 
aus chemisch verknupften Bauelementen bestehen. Im Formenraum 
benachbarte Molekule konnen im Sequenzraum durchaus weit 
voneinander entfernt liegen und umgekehrt . [Analog s. o.: 
Struktur a) 3 alpha-Helices, Struktur b) 2 Alpha-Helices plus 
unstrukturierter Bereich mit endstandiger , kurzer Helix, c) 
antiparalleles beta-Faltblatt aus 4 Blattern] Der Funktionen- 
raum ist definiert durch die geometrische , dynamische und 
physikalisch/chemische Oberf lachenstruktur , die mit einem 
weiteren Molekiil in spezifische Wechselwirkung treten kann. 
Homologien beschreiben Ahnlichkeiten der Oberf lachenstruktur 
und den damit verbundenen Wechselwirkungseigenschaf ten . 

Im folgenden werden lineare Kombinationen von Formencodes 
uber in vitro Rekombination von Formencodes aus natur lichen 
oder in vitro hergestellten Muteinen beschrieben. 

Bei der linearen Kombination von Formencodes konnen hetero- 
loge wie auch zumindest teilweise homologe Formencodes 
verwendet werden, Sequenzhomologe Formencodes konnen zufallig 
in einer zu rekombinierenden Mischung vorhanden sein oder 
bewuSt ausgewahlt werden. Diese Mischung kann beispielsweise, 
wie bei Eigen & Henco WO 92/18645 beschrieben, homolog 
auseinander hervorgegangene Mutantenkollektive einer Aus- 
gangssequenz , oder homologe Gene verwandter oder unterschied- 
licher Organismen enthalten. Dabei konnen ahnliche Sequenzen, 
z. B. bezuglich ihrer Funktionscodes , sehr unterschiedlich 
sein. 

Die Natur hat fur ein und dieselbe oder sehr ahnliche 
Reaktionen, fur verschiedene Wirtssystem ahnliche oder mole- 
kular unterschiedliche Enzyme evolviert # von denen angenommen 
werden kann, daS sie fur die jeweilige Umgebung, fur die sie 
angepaBt wurden, optimale Losungen bieten. Dafur ist die 
Penicillinacylase beispielhaf t . Dieses Enzym ist fur die 
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industrielle Anwendung im Bereich der Synthase von zentraler 
Bedeutung. Vor einer Synthese halbsynthetischer Derivate des 
Penicillin-Grundkopers mu£ in natiirlicher Weise synthe- 
tisiertes Penicillin zunachst schonend einer Acylase-Reaktion 
unterworfen werden, bevor es in einer Umkehrung des Prozesses 
wiederum mit kunstlichen Derivaten reacyliert werden kann . 
Fur beide Reaktionen kann die Penicillinacylase eingesetzt 
werden. Fur diese Reaktion sind bestimmte Reaktions- 
bedingungen und Substrate erwunscht. Diese Bedingungen 
unterscheiden sich jedoch von der in vivo Situation des 
Mikroorganismus, aus dem jeweils Penicillinacylasen isoliert 
wurden. Dies triff t: zum Beispiel auf die optimale Lage des 
Gleichgewichtes fiir das acylierte Syntheseprodukt oder fur 
die hydro lytische Spaltung zu. Es ist gewiinscht, das Enzym 
bezogen auf die Umsatzzahl unter den industriell am besten 
geeigneten Bedingungen zu optimieren. 

Insbesondere kann von einem Gen einer bestimmten naturlich 
vorkommenden Acylase ausgegangen und diese konsekutiven 
Mutations- und Selektionszyklen unterworfen werden. Wenn 
verschiedene , aktive Mutanten gefunden sind, lassen sich die 
als positiv selektierten unterschiedlichen Varianten bezogen 
auf die jeweils selektierten Punktmutat ionen uber Re- 
kombination ein weiteres Mai durchmischen . Die so zu 
mischenden Varianten konnen wie in WO 92/18645 beschrieben 
gewonnen werden. Die Natur verfugt haufig bereits uber eine 
Kollektion von positiv selektierten Muteinen in Form der 
Enzymgene aus verschiedenen Mikroorganismen, die beispiels- 
weise den gewunschten Reaktionstyp katalysieren . Von diesen 
Kollektionen ausgehend, lassen sich bereits Spektren rekombi- 
nierter Forxnencodes und Funktioriscodes erzeugen, bevor 
eventuell wieder im weiteren Verlauf Mutations- oder eine 
Kombination von Mutations - /Rekombinationszyklen durchlaufen 
werden. Es ist durchaus vorteilhaft, am Anfang eines solchen 
Prozesses von moglichst umf angreichen Formencodes auszugehen, 
deren Mutat ionen sich in einem bestimmten Kontext des je- 
weiligen Gens als positiv oder neutral erwiesen haben. 
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Die in vitro -Rekombination wird dabei vorzugsweise nach zwei 
unterschiedlichen Strategien durchgef uhrt . 

Rekombination kann ein in der Regel unerwiinschtes Neben- 
produkt einer Amplif ikationsreaktion im Sinne einer PCR- 
Reaktion sein. Wenn in der Sattigungsphase einer PCR-Reaktion 
nach dem Durchlauf en vieler Zyklen die Losung an Reagentien 
oder Enzym verarmt und die Reaktion unterhalb des Km-Wertes 
fur bestimmte Nucleot idtriphosphate verlauft, kommt es 
zwangslauf ig zu nicht f ertiggestellten ' Syntheseprodukten . 
Solche Ereignisse sind als unerwunschte Artefakte bereits 
von Simon Wain-Hobson diskutiert worden, urn HIV-Varianten 
als mogliche Artefakte nach erfolgter PCR-Amplif ikation zu 
beschreiben, Dieser Effekt wird aber erf indungsgemaS einge- 
setzt und gesteuert, insbesondere noch verstarkt, daS wunsch- 
gemaS unvollstandig synthetisierte Produkte dominant werden. 
Wenn gleichzeitig die Primer- induzierte Neusynthese unvoll- 
standig erfolgt, hybridisieren maSgeblich unvollstandige 
Syntheseprodukte mit vollstandig oder ebenfalls unvollstandig 
synthetisierten Gegenstrangen. Dabei kommt es zu molekularen 
Rekombinationsereignissen, bei denen verschiedene Gensegmente 
im Sinne einer Rekombination von Formencodes miteinander 
rekombiniert werden . 

Erf indungsgemaS laSt sich nach einer weiteren spezifischen 
Vorgehensweise die Rekombination wahrend und nicht nur nach 
einer PCR-Reaktion steuern. Hierbei werden der standard- 
maSigen PCR-Reaktion kurze Oligomere zugesetzt, die nur dann 
als PCR-Primer fungieren, wenn die Initiation der Synthese 
mittels thermostabiler Polymerase bei vergleichsweise tiefen 
Temperaturen erfolgt. Wann immer die korrekte PCR-Reaktion 
dominieren soli, wird ein normaler Temperaturzyklus ausge- 
f uhrt . Wenn es zu internen Startreaktionen kommen soli, 
werden einige Zyklen bei niedriger Temperatur initiiert, 
eventuell unter Zusatz von Polymerasen wie DNA- Polymerase 
I, wie sei bei Oligomer-gestarteten Markierungsreaktionen 
eingesetzt wird (Sambrook, Fritsch, Maniatis, "Molecular 
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cloning") , Die entstehenden unvollstandigen Sequenzen konnen 
sich bei weiteren Amplif ikationsrunden zusammenlagern, wobei 
die uberhangenden Enden jeweils am 3'-Ende aufgefullt werden 
konnen, Bei diesen Reaktionen mufi gema£ an sich bekannten 
Reassoziationskinetik von Nucleinsauren darauf geachtet 
werden, daS die fur eine Rekombination bestimmten Sequenzen 
in hinreichender Konzentrat ion zur Verfugung stehen, um in 
wenigen Sekunden bis Minuten die unvollstandig gepaarten 
Duplices auszubilden. Um zu vermeiden, daS bei der matrizen- 
vermittelten Neusynthese unerwiinscht eine Strangverdrangung 
anstelle eines Rekombinationsereignisses stattfindet, werden 
insbesondere solche Polymerasen verwendet, die keine Strang- 
verdrangung induzieren oder keine 5' -3 ' -Exonucleaseaktivitat 
aufweisen. Stattdessen lassen sich bevorzugt thermostabile 
Ligasen einsetzen, so da£ Rekombinationsereignisse durch 
kovalente Verknupfung der Fragmente fixiert werden.. 

Im erf indungsgemafien Verfahren zur Rekombination von Formen- 
codes setzt man Element e mit zumindest teilweisen Sequenz- 
homologien, wie sie oben beschrieben wurden, ein. Mit Hilfe 
raatrizenabhangiger chemischer oder enzymatischer DNA- oder 
RNA-Synthese durch Verlangerung von erzeugten (randomi- 
sierten) Primern oder ausgewahlten (konstruierten) Primern 
wird eine Vielzahl von Fragmenten mindestens einer ursprung- 
lichen Seguenz erzeugt (s* Fig. 9 - 11). Ausgewahlte Primer 
mit definierter Sequenz konnen dabei so posit ioniert werden, 
daS bestimmte Bereiche der zu bearbeitenden DNA- ode rRNA- 
Molekule, z. B, aktiven Zentren, Endonuclease-spezif ische 
Spaltstellen oder genregulatorische Elemente, vom Rekom- 
binationsprozete ausgeschlossen sind und somit unverandert 
erhalten bleiben. Der Einsatz teilweise randomisierter Primer 
in Bereichen (partieller) Komplementaritat analog Mutagani- 
sierungs-Primern, kann dazu verwendet werden, zusatzlich eine 
erhohte Mutationsrate einzufiihren. Durch den Einsatz einer 
kleinen, subinhibitorischen Menge von Kettenabbruchmonomeren, 
in der DNA-Synthese von vorzugsweise Dideoxynucleotiden, wird 
ein zufalliger Abbruch der Verlangerungsreaktion und damit 
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eine Langenvarianz der synthetisierten Polymere erreicht . 
Mittels des Verhaltnisses der Konzentration des Abbruch- 
reagenz zu den Konzentrationen der Nucleotidmonomeren laSt 
sich wie bei einer Sequenzierungsreaktion die durchschnitt - 
liche Kettenlange des Syntheseproduktes steuern, Nach Ab- 
trennung des polymerisierenden Agenz , beispielsweise einer 
Inaktivierung des Enzyms, kann die endstandige Schutzgruppe , 
d. h. das Kettenabbruchtnonomer ganz oder teilweise wieder 
abgespaltfen werden, damit die entstehenden Polymere wieder 
gute Substrate fur die Verlangerungsreaktion sind (Fig. 12) . 
Die so entschutzten DNA- oder RNA- Polymere werden dann 
mi.ndestens einem Zyklus aus Denaturierung/Hybridisierung 
teilweise komplementarer Strange gefolgt von einer Auf full - 
reaktion unterzogen. Am Schlufi des Verfahrens wird das 
entstandene Gemisch verlangerter Polymere einer Polymerase- 
Kettenreaktion unterzogen, wobei die Primer vorzugsweise 
komplementar zu den Enden der ursprunglich eingesetzten 
Seguenz liegen sollten. Auf diese Weise entstehen wieder 
Produkte der urspriinglichen Lange. Diese enthalten jetzt aber 
Kombinat ionen von Sequenzabschnitten verschiedener vorteil- 
hafter, bereits selektierter , einzelner Punktionmut at ionen 
in sehr effizienter Weise zu kombinieren, statt sie 
seguentiell in einem stochastischen ProzeE erst erzeugen zu 
muss en 
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Anspruche 


1. Verfahren zur Herstellung oligomerer Oder polymerer Funktion- 
selemente aus Formenelementen, wobei die Funkt ionselemente 
erhaltlich sind durch Verknupfung von mindestens zwei Formeri- 
elementen, von denen mindestens ein Formenelement selbst aus 
mindestens zwei Monomeren aufgebaut ist, die durch mindestens 
eine chemische Bindung verknupft sind, die der chemischen 
Bindung zwischen zwei Formenelementen entspricht . 

2. Verfahren gemaS Anspruch 1, wobei die Verknupfung der Formen- 
elemente unter Einsatz einer f esten Phase als Reaktionstrager 
durchgef uhrt wird . 

3. Verfahren gemaS Anspruch 1 und/oder 2, wobei die Verknupfung 
der Formenelemente chemisch und/oder enzymatisch erf olgt . 

4 . Verfahren gemaS mindestens einem der Anspruche 1 - 3 , wobei 

die Verknupfung von Formenelement en zu Funkt ionselementen 
planmafiig und/oder stochastisch erf olgt . 

5 . Verfahren gema£ mindestens einem der Anspruche 1 - 4 , wobei 

die Verkniupfung schrittweise aufbauend, stereospezif isch 
und/oder gerichtet erf olgt, 

6 . Verfahren gemaS mindestens einem der Anspruche 1 bis 5 , 
dadurch gekennzeichnet , daS die Formenelemente zur Stoff- 
klasse der Nucleinsauren, doppelstrangiger und/oder einzel- 
strangiger DNA und/oder RNA und/oder modif izierten Nuclein- 
sauren und/oder Peptiden und/oder Polypeptiden gehoren 
und/oder aus sonstigen kopplungsf ahigen chemischen Oligomer- - 
Formenelementen aufgebaut sind. 

7. Verfahren gemafi mindestens einem der Anspruche 1-6, dadurch 
gekennzeichnet, da& die Formenelemente als bereits synthe- 
tisierte Oligomer-Bausteine eingesetzt werden oder zunachst 
im Reaktionsgef aS generiert werden. 
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8. Verfahren gemaS mindestens einem der Anspruche 1-7, dadurch 
gekennzeichnet , da£ die Reaktionen in parallel .gefuhrten 
Micro-Reaktionsansatzen durchgefuhrt werden, bei denen 
Formenelemente in vorbestimmter Reihenfolge verkmipft werden. 

9. Verfahren gemaS mindestens einem der Anspruche 1-8, dadurch 
gekennzeichnet, dafi nach erfolgter Synthese die Reaktions- 
produkte, wie Funk t i oris e 1 emen t e oder Vorstufen davon fest- 
phasengekoppelt bleiben oder in die losliche Phase entkoppelt 
werden. 

10. Verfahren nach Anspruch 9, wobei die Reakt ionsprodukte mit 
einem biologischen Testsystem vereinigt werden, wobei die 
Funktion im gleichen Volumenelement wie die Synthese be- 
wertend gemessen wird, z.B. durch den Einsatz der FCS-- 
Analysetechnik . 

11. Verfahren gema£ mindestens einem der Anspruche 1 - 10, 
dadurch gekennzeichnet, daS pro Reakt ionsschritt bei der 
schrittweisen Verknupfung der Formenelemente jeweils ein 
Formenelement als Reaktionspartner an fester Phase gekoppelt 
ist . 

12- Verfahren gemafi mindestens einem der Anspruche 1 - 11/ 
dadurch gekennzeichnet, da£ Mischungen von Formenelement en 
eingesetzt werden und/oder generiert werden konnen. 

13. Verfahren gemaS mindestens einem der Anspruche 1 - 12, 
dadurch gekennzeichnet, dafi im Falle des Aufbaues von 
Nucleinsaure-Formenelementen und/oder der Verknupfung von 
Nucleinsaure-Formenelementen wenigstens ein Reaktionspartner 
eine Schnittstelle fur ein Restriktionsenzym enthalt und/oder 
frei von Start- und/ oder Stopcodons ist. 

14. Verfahren gemaS mindestens einem der Anspruche 1 - 13, 
dadurch gekennzeichnet, da£ liber die Einfuhrung von Restrik- 
tionsschnittstellen, insbesondere solchen fur Enzyme der 
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Klasse IIS beliebige Sequenzen gerichtet verknupft werden 
konnen, ohne da£ Sequenzerf ordernisse des erwiinschten Endpro- 
duktes die Wahl des Reaktionsenzyms beeinflufien. 

15 . Verf ahren gemaS mindestens einem der Anspruche l - 14 , 
dadurch gekennzeichnet , da£ uber die Einfiihrung von einzelst- 
rangigen Uberhangen und/ oder selektive und reversible 
chemische und/oder enzymatische Modif ikation der 3' -Enden 
und/oder der 5 '-Enden der Nucleinsauren, zum Beispiel 
Phosphorylierung, beliebige Sequenzen gerichtet verknupft 
werden konnen, ohne dafi dabei irgendwelche Anf orderungen an 
die Sequenz des erwunschten Endproduktes entstehen. 

16. Verf ahren gemaS mindestens einem der Anspruche 1 - 15, 
dadurch gekennzeichnet, da£ Formenelemente nach dem Vorbild 
rontgenkristallograf isch analysierter naturlicher Proteine 
oder Polypeptide eingesetzt werden. 

17* Verf ahren gemaS mindestens einem der Anspruche 1 - 16, 
dadurch gekennzeichnet, da£> mindestens eines der verwendeten 
Formenelemente aus Selektionsexperimenten stammt. 

18. Verf ahren gemafi mindestens einem der Anspruche 1 - 17, 
dadurch gekennzeichnet, daS die Formenelemente zwischen 1 
und 6 0 Aminosauren enthalten oder Nucleotide entsprechender 
Kodierungslange . 

19. Verf ahren gemafi mindestens einem der Anspruche 1 - 18, 
dadurch gekennzeichnet, daS Formenelemente eingesetzt werden, 
die an bestimmten Positionen degeneriert sind und/oder 
Deletionen oder Insertionen tragen. 

20* Verf ahren gernaH einem der Anspruche 1 bis 19, dadurch gekenn- 
zeichnet, da£ die Funktions- und/oder Formenelemente bzw. 
Funktionscodes und/oder Formencodes als Oligo- oder Poly- 
nucleotide niedergelegt sind, die erhaltlich sind 



WO 95/17413 


PCT7EP94/04240 


- 26 - 


durch Generierung aus Algorithmen, insbesondere evo- 
lutiver Algorithmen, 

durch Ubernahme oder Modif izierung naturlich vorkommen- 
der Nucleinsauren und/oder, 

Generierung mittels de novo Synthese von Oligo-/Poly- 
nucleotiden durch matrizenabhangige oder -unabhangige 
Reaktionen von Polymerasen mit Nucleotiden. 


21. Verwendung des Verfahrens getnaE mindestens einem der 
Anspruche 1 20 zur Synthese parallel aufgebauter Formen- 
Bibliotheken funktionaler Oligomere oder Polymere. 
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FIGUR 7 
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Sequenzraum - Formenraum - Funktionsraurr 



Der Sequenzraum ist durch die Iinearen 

Nachbarschaftsbeziehungen einer 

Polymerstruktur definiert. m 

Homologien beschreiben Ahnlichkeiten (in %) in 

der Abfolge der Bauelemente einer chemischen 

Stoffklasse. 



Der Formenraum ist definiert durch die 
raumlichen Nachbarschaftsbeziehungen der 
Bausteine einer Polymerstruktur. 
Homologien beschreiben Ahnlichkeiten der 
Raumstruktur von nicht unmittelbar chemisch 
verknupften Bauelementen. 



Der Funktionenraum ist definiert durch die 
geometrische, dynamische und 
physikalisch/chemische Oberflachenstruktur, die 
mit einem weiteren Molekul in spezifische 
Interaktion treten kann* 
Homologien beschreiben Ahnlichkeiten der 
Oberflachenstruktur und den darnit verbundenen 
Wechselwirkungseigenschaften. 
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Streptavidin-Dynabeads mit 
Matritzenstrang im Niederschlag 
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Figur 13 
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PGR ohne Primer 


Figur 14 
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